NPU IP(Neural Processing Unit IP)
神经网络处理器 IP,AI 时代爆发性增长的细分。从 2017 寒武纪 1A 开始,到 2024 已成为手机 SoC、AIoT、端侧大模型设备的"标配模块"(据2-08)。
是什么
NPU IP 是专门优化神经网络张量运算的硬件 IP,相比通用 处理器 IP 在 AI 推理场景能效比可高 10-100x。架构核心:
- MAC 阵列(乘累加)— 矩阵乘法的硬件加速
- 片上 SRAM — 减少 DRAM 访问
- 数据流引擎 — 张量并行调度
代表 IP
| 厂商 | IP 系列 | 性能亮点 |
|---|---|---|
| Cadence | Tensilica DNA / Neo NPU | 业界主流、可定制 |
| 芯原股份 | VIP9000 | 25.6 TOPS @ INT8、支持 LLM |
| 平头哥半导体 | 含光 NPU / 含光 800 | 云端推理 78,563 IPS |
| ARM Holdings | Ethos-N / Ethos-U | 手机 / IoT |
| CEVA | NeuPro | 边缘 AI |
AI 时代新特性
随着大模型出现,NPU IP 加入以下能力:
- 稀疏计算 — 利用神经网络权重稀疏性,节省功耗
- 混合精度(FP8 / INT4 / INT8) — 大模型推理量化
- Transformer / Diffusion 加速 — 针对 Attention 算子优化
- 支持 KV Cache — 大模型推理刚需
战略意义
- 端侧大模型(手机、PC、机器人)刚需 → NPU IP 价值持续上升
- NVIDIA / AMD 自研 NPU 不外授 → IP 市场仍属第三方天下
- 国产化重点:VIP9000、含光 NPU 是 AI 大模型时代国产 IP 突破口